Python正则表达式模块re

366次阅读
没有评论

共计 1530 个字符,预计需要花费 4 分钟才能阅读完成。

元字符匹配

单字符匹配:

字符 功能
. 匹配任意字符,除了 \n
[] 匹配 [] 中列举的字符
\d 匹配数字,相当于[0-9]
\D 匹配非数字
\s 匹配空白,即空格、tab 键
\S 匹配非空白
\w 匹配单词字符,即任意字母数字下划线
\W 匹配非单词字符

数量匹配:

字符 功能
* 0 或多个,相当于{0,}
+ 至少一个,相当于{1,}
? 0 或 1 个,相当于{0,1}
{m} 匹配前一个规则的字符出现 m 次

边界匹配:

字符 功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配单词边界
\B 匹配非单词边界

分组匹配:

字符 功能
` ` 匹配左右任意一个表达式
() 将括号中字符作为一个分组

findall()

匹配字符串中所有符合正则的内容(都没找到返回空列表[])。

import re
s = '我的号码是:10086,你的号码是 10010'
list = re.findall(r'\d+', s, re.S)
print(list)  # ['10086', '10010']

字符串的 r 标记,表示当前字符串是原始字符串,即内部的转义字符无效而是普通字符。

re.S 的作用是让 findall()函数在查找时可以自动考虑换行的影响,使得非贪婪匹配可以匹配换行。

re 模块中的标志还有:

  • re.IGNORECASE,忽略大小写
  • re.MULTILINE,多行匹配
  • re.DOTALL,作用类似 re.S
# 通过正则表达式获取图片名称 title 和图片网址 src,res 为网页源代码
p_title = '<img width="100" alt="(.*?)"'
title = re.findall(p_title, res)
p_img = '<img width="100" alt=".*?" src="(.*?)"'
src= re.findall(p_img, res)

非贪婪匹配:“(.?)”用于提取文本 A 与文本 B 之间的内容;“.?”用于代替文本 A 和文本 B 之间的内容。

finditer()

匹配字符串中所有符合正则的内容,返回的结果是迭代器。

iter = re.finditer('d+', s)
for i in iter:
    print(i.group())

输出结果如下:

10086
10010

search()

找到一个结果就返回(都没找到返回 None),返回结果是 match 对象。

s = " 我的号码是:10086,你的号码是 10010"
search = re.search("\\d+", s)
print(search.span())  # (6, 11)
print(search.group())  # 10086

match()

从头开始匹配。

s = '我的号码是:10086,你的号码是 10010'
m = re.match('\\d+', s) # 匹配不到
s2 = "10086,10010"
m2 = re.match("\\d+", s2)
print(m2.span())  # (0, 5)
print(m2.group())  # 10086

sub()

sub()函数的名称来自英文单词 substitute(替换),语法格式:re.sub(需要替换的内容, 替换值, 原字符串)

预加载正则表达式

s = '我的号码是:10086,你的号码是 10010'
obj = re.compile('d+')
ret = obj.finditer(s)
for i in ret:
    print(i.group())

s = "<div class='first'><span id='2'> 周杰伦 </span></div>"
# (?P< 分组名字 > 正则)可以单独从正则匹配的内容中进一步提取内容
obj = re.compile("<span id='d+'>(?P<name>.*?)</span>", re.S)
result = obj.finditer(s)
for i in result:
    print(i.group("name"))  # 结果为:周杰伦

正文完
 0
阿伯手记
版权声明:本站原创文章,由 阿伯手记 于2023-08-17发表,共计1530字。
转载说明:本站原创内容,除特殊说明外,均基于 CC BY-NC-SA 4.0 协议发布,转载须注明出处与链接。
评论(没有评论)
验证码

阿伯手记

阿伯手记
阿伯手记
喜欢编程,头发渐稀;成长路上,宝藏满地
文章数
767
评论数
207
阅读量
682470
今日一言
-「
热门文章
职场救急!AI请假话术生成器:1秒定制高通过率理由

职场救急!AI请假话术生成器:1秒定制高通过率理由

超级借口 不好开口?借口交给我!智能生成工作请假、上学请假、饭局爽约、约会拒绝、邀约推辞、万能借口等各种借口理...
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
TVAPP:开源电视盒子资源库,一键打造家庭影院

TVAPP:开源电视盒子资源库,一键打造家庭影院

导语 TVAPP 是一个专为 Android TV 电视盒子用户打造的开源影音资源库,集成了影视、直播、游戏等...
巴别英语:用美剧和TED演讲轻松提升英语听力与口语

巴别英语:用美剧和TED演讲轻松提升英语听力与口语

还在为枯燥的英语学习而烦恼吗?巴别英语通过创新的美剧学习模式,让英语学习变得生动有趣。平台提供海量美剧和 TE...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
2025年12月 每日精选

2025年12月 每日精选

关于每日精选栏目 发现一些不错的资源,点击 这里 快速投稿。 12 月 26 日 .ax 顶级域 目前全球唯一...
123云盘限时福利:登录即送1个月VIP尊享权益!

123云盘限时福利:登录即送1个月VIP尊享权益!

🎁  零成本体验 20T 超大空间与会员加速通道 🎉 活动亮点 登录即送:无需任何复杂操作,登录账号直接领取 ...
最新评论
阿伯手记 阿伯手记 发了:https://aboss.top/moments/1064
吴蛋蛋 吴蛋蛋 快发小年快乐
吴蛋蛋 吴蛋蛋 Ask4Me,这个之前看server酱接入了
15220202929 15220202929 怎么用
八对 八对 麻烦大佬更新下【堆新】的友链站名:八对星星描述:极目星视穹苍无界•足履行者大地有疆链接:https://8dui.com图标:https://cf.8dui.com/logo.webp横标:https://cf.8dui.com/logo-w.webp订阅:https://8dui.com/rss.xml
三毛笔记 三毛笔记 已添加
DUINEW DUINEW 已添加贵站,期待贵站友链~博客名称:堆新博客地址:https://duinew.com/博客描述:堆新堆新,引力向新!——堆新(DUINEW)博客头像:https://d.duinew.com/logo.webp横版头像:https://d.duinew.com/logo-w.webp博客订阅:https://duinew.com/rss.xml
hedp hedp 没看懂
bingo bingo 直接生成就可以啦,也可以添加一些选项
热评文章
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 是一款基于 Fastify、Vercel 和 Supabase 构建的 URL 缩短服务...
清华大学官方免费DeepSeek教程

清华大学官方免费DeepSeek教程

AI 领域近期最引人注目的焦点当属 DeepSeek,这款由中国创新企业深度求索研发的人工智能工具,正以开放源...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
2026年2月 每日精选

2026年2月 每日精选

关于每日精选栏目 发现一些不错的资源,点击 这里 快速投稿。 2 月 17 日 国家全民健身信息服务平台 过年...
DrawLink:一键生成链接视觉卡片,提升分享点击率

DrawLink:一键生成链接视觉卡片,提升分享点击率

小贴士 :此站或已变迁,但探索不止步。我们已为您备好「类似网站」精选合集,相信其中的发现同样能为您带来惊喜。
WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror 是一款基于 WebRTC 技术的在线屏幕共享工具,它利用浏览器内置的...